Home Catalogue search

eng

Refine your search:

Search in the Catalogues and Directories






	Sort by
Simple Search

Page: 1 2 3 4 5...34

Hits 1 – 20 of 673

1	Corpus numériques en FLE/FLS/FOS
	Cavalla, Cristelle
	In: La didactisation des corpus pour le FLE/FLS/FOS ; https://hal.archives-ouvertes.fr/hal-03622249 ; La didactisation des corpus pour le FLE/FLS/FOS, Jean-Marc Mangiante; Luis Meneses-Lerin, Mar 2022, Arras, France ; http://grammatica.univ-artois.fr/content/download/426/1696/file/Programme.pdf (2022)
	BASE
	Show details

2	Emotions, corpus, enseignement
	Cavalla, Cristelle
	In: Séminaire DIPRALANG ; https://hal.archives-ouvertes.fr/hal-03622247 ; Séminaire DIPRALANG, Jovan Kostov; Elodie Lang, Jan 2022, Montpellier, France (2022)
	BASE
	Show details

3	Language identification, a tool for Corsican and for the evaluation of linguistic resources ; L'identification de langue, un outil au service du corse et de l'évaluation des ressources linguistiques
	Kevers, Laurent
	In: Traitement Automatique des Langues ; https://hal.archives-ouvertes.fr/hal-03633290 ; Traitement Automatique des Langues, 2022, Diversité Linguistique, 62 (3), pp.13-37 ; https://www.atala.org/content/diversité-linguistique-linguistic-diversity-natural-language-processing (2022)
	Abstract: International audience ; The constitution of corpora is one of the first priorities faced by less-resourced languages. The emergence of Internet-based resources of increasing size and covering more and more languages may suggest that this issue has been resolved, but this is not the case. Following Caswell et al. (2021), who evaluated several large resources, including one with Corsican content, we conducted an analysis of two corpora including this language: An Crúbadán and W2C. In parallel to a manual evaluation, we considered the possibility of using one or more language identification modules to filter the content of these resources, which turns out to be possible but at the cost of low recall. For this task, we tested and re-trained various systems in order to adapt them to Corsican. This work makes it possible to provide a model allowing the identification of 17 European languages as well as Corsican ; La constitution de corpus est une des premières priorités que rencontrent les langues peu dotées. L’émergence de ressources issues d’Internet, de tailles de plus en plus imposantes et couvrant de nombreuses langues, peut laisser penser que ce point est désormais résolu, ce qui n’est pas le cas. À la suite de Caswell et al. (2021), qui ont évalué plusieurs ressources de grande envergure, dont une disposant de contenu corse, nous avons mené une analyse de deux corpus incluant cette langue : An Crúbadán et W2C. Parallèlement à une évaluation manuelle, nous avons estimé la possibilité d’utiliser un ou plusieurs modules d’identification de langue afin de filtrer le contenu de ces ressources, ce qui s’avère possible mais au prix d’un rappel peu élevé. Pour cette tâche, nous avons testé et réentraîné divers systèmes afin de les adapter au mieux au corse. Ce travail nous permet de mettre à disposition un modèle capable d’identifier le corse ainsi que 17 autres langues européennes.
	Keyword: [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; corpora; corpus; corse; Corsican; identification de langue; language identification; langues peu dotées; less-resourced languages; qualité; quality
	URL: https://hal.archives-ouvertes.fr/hal-03633290/file/TAL_62_3_1_Kevers_HAL.pdf https://hal.archives-ouvertes.fr/hal-03633290/document https://hal.archives-ouvertes.fr/hal-03633290
	BASE
	Hide details

4	XRONOLOGIK LINGVISTIK KORPUS YARATISHDA GAZETA MATNLARI O‘RGANISH OBYEKTI SIFATIDA ...
	Abduraxmonova, Nilufar Zaynobiddin Qizi; Gulchehra Shuhratjon Qizi Arabboyeva. - : Academic research in educational sciences, 2022
	BASE
	Show details

5	Corpus of Early English Correspondence Extension Sampler part 2 (CEECES 2) ...
	Nevalainen, Terttu; Kaislaniemi, Samuli; Säily, Tanja. - : Zenodo, 2022
	BASE
	Show details

6	Tagged Corpus of Early English Correspondence Extension Sampler (TCEECES) ...
	Nevalainen, Terttu; Kaislaniemi, Samuli; Säily, Tanja. - : Zenodo, 2022
	BASE
	Show details

7	Corpus of Early English Correspondence Extension Sampler part 1 (CEECES 1) ...
	Nevalainen, Terttu; Kaislaniemi, Samuli; Säily, Tanja. - : Zenodo, 2022
	BASE
	Show details

8	Tagged Corpus of Early English Correspondence Extension Sampler (TCEECES) ...
	Nevalainen, Terttu; Kaislaniemi, Samuli; Säily, Tanja. - : Zenodo, 2022
	BASE
	Show details

9	Corpus of Early English Correspondence Extension Sampler part 2 (CEECES 2) ...
	Nevalainen, Terttu; Kaislaniemi, Samuli; Säily, Tanja. - : Zenodo, 2022
	BASE
	Show details

10	Corpus of Early English Correspondence Extension Sampler part 1 (CEECES 1) ...
	Nevalainen, Terttu; Kaislaniemi, Samuli; Säily, Tanja. - : Zenodo, 2022
	BASE
	Show details

11	Prices are rising, wages are falling: Argument structure of verbs denoting ‘increase’ and ‘decrease’ in the Russian language
	Valentina Y. Apresjan
	In: Russian Journal of Linguistics, Vol 26, Iss 1, Pp 194-223 (2022) (2022)
	BASE
	Show details

12	A very unpredictable ‘person’: A corpus-based approach to suppletion in West Polesian
	Kristian Roncero
	In: Russian Journal of Linguistics, Vol 26, Iss 1, Pp 116-138 (2022) (2022)
	BASE
	Show details

13	A GENRE AND COLLOCATIONAL ANALYSIS OF THE NEAR-SYNONYMS TEACH, EDUCATE AND INSTRUCT: A CORPUS-BASED APPROACH
	Thana Kruawong; Supakorn Phoocharoensil
	In: TEFLIN Journal, Vol 33, Iss 1, Pp 75-97 (2022) (2022)
	BASE
	Show details

14	Phonologically motivated orthographic variation in Modern Uyghur: the voicing of h
	Fiddler, Michael
	In: Proceedings of the Workshop on Turkic and Languages in Contact with Turkic; Vol 6 (2021); 5049 ; 2641-3485 (2022)
	BASE
	Show details

15	DELA Corpus - A Document-Level Corpus Annotated with Context-Related Issues
	Castilho, Sheila; Cavalheiro Camargo, João Lucas; Menezes, Miguel...
	In: Castilho, Sheila orcid:0000-0002-8416-6555 , Cavalheiro Camargo, João Lucas orcid:0000-0003-3746-1225 , Menezes, Miguel and Way, Andy orcid:0000-0001-5736-5930 (2021) DELA Corpus - A Document-Level Corpus Annotated with Context-Related Issues. In: Sixth Conference on Machine Translation (WMT21), 10-11 Nov 2021, Punta Cana, Dominican Republic (Online). ISBN 978-1-954085-94-7 (2021)
	BASE
	Show details

16	Intelligence artificielle et discours politique. Quelles plus-values interprétatives ? Application aux corpus parlementaire et présidentiel contemporains
	Guaresi, Magali; Mayaffre, Damon
	In: L'intelligence artificielle des textes. Des algorithmes à l'interprétation ; https://hal.archives-ouvertes.fr/hal-03347997 ; L'intelligence artificielle des textes. Des algorithmes à l'interprétation, 17, Honoré Champion, pp.131-182, 2021, Lettres numériques, 9782815937467 (2021)
	BASE
	Show details

17	Retour d’expérience d’une fouille de corpus en SHS : démarches, objets et outils pour interroger la définition de « interculturel »
	Brudermann, Cédric; Aguilar Río, Jose Ignacio
	In: ONELA 2021, Outils et Nouvelles Explorations de la Linguistique Appliquée ; https://hal.archives-ouvertes.fr/hal-03472280 ; ONELA 2021, Outils et Nouvelles Explorations de la Linguistique Appliquée, Oct 2021, Toulouse, France ; https://onela2021.sciencesconf.org/ (2021)
	BASE
	Show details

18	L’usage des termes difficulté(s) et trouble(s) dans un corpus de comptes rendus de bilans orthophoniques.
	Brin-Henry, Frédérique; Knittel, Marie-Laurence
	In: ISSN: 2552-7665 ; L’Entre-deux ; https://hal.archives-ouvertes.fr/hal-03504599 ; L’Entre-deux, Université d'Artois - Textes & Cultures (EA 4028), A paraître ; https://lentre-deux.com/index.php?b=numero10 (2021)
	BASE
	Show details

19	Prosodic segmentation and cross-linguistic comparison in CorpAfroAs and CorTypo: Corpus-driven and corpus-based approaches
	Mettouchi, Amina; Vanhove, Martine
	In: ISSN: 1934-5275 ; EISSN: 1934-5275 ; Language Documentation & Conservation ; https://hal.archives-ouvertes.fr/hal-03344410 ; Language Documentation & Conservation, University of Hawaiʻi Press In press (2021)
	BASE
	Show details

20	Rôles et valeurs des emplois en « c’est » dans le corpus Philosophèmes
	Roiné, Philippe; Blasco, Mylène; Auriac-Slusarczyk, Emmanuèle
	In: Des corpus numériques à l'analyse linguistique en langues de spécialité ; https://hal.uca.fr/hal-03464832 ; Frérot Cécile et Pecman Mojca. Des corpus numériques à l'analyse linguistique en langues de spécialité, UGA Editions Université Grenoble Alpes, pp.337-360, 2021, 978 -2-37747-261-1 (2021)
	BASE
	Show details

Page: 1 2 3 4 5...34

© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern